home *** CD-ROM | disk | FTP | other *** search
/ Usenet 1993 July / InfoMagic USENET CD-ROM July 1993.ISO / answers / chinese-text-faq < prev    next >
Encoding:
Internet Message Format  |  1993-06-03  |  19.0 KB

  1. Path: senator-bedfellow.mit.edu!enterpoop.mit.edu!biosci!uwm.edu!linac!att!news.cs.indiana.edu!yawei@cs.indiana.edu
  2. From: yawei@cs.indiana.edu (Ya-Gui Wei)
  3. Newsgroups: news.answers,alt.chinese.text
  4. Subject: How to Read Chinese Text on Usenet: FAQ for alt.chinese.text
  5. Keywords: faq, chinese text
  6. Message-ID: <1993Jun3.194906.1525@news.cs.indiana.edu>
  7. Date: 4 Jun 93 00:48:54 GMT
  8. Expires: 31 Jul 1993
  9. Followup-To: alt.chinese.text
  10. Organization: Indiana University
  11. Lines: 417
  12. Approved: news-answers-request@MIT.Edu
  13. Xref: senator-bedfellow.mit.edu news.answers:9044 alt.chinese.text:7614
  14.  
  15. Archive-name: chinese-text-faq
  16. Original-Author: Ya-Gui Wei ~{N:QG9p~}
  17. Last-modified: June 2 1993
  18. Version: 12
  19.  
  20.  CONTENTS
  21.  
  22.  (1) What are those ~{BRF_0KTc5D6+Nw~}'s posted to alt.chinese.text? 
  23.  (2) Where can I find the software to read Chinese articles?
  24.  (3) Are these software packages pretty easy to use?
  25.  (4) How do I post Chinese text articles to usenet? 
  26.  (5) What is 'HZ'?
  27.  (6) What is FTP and how do I use it?
  28.  (7) How do I convert HZ Chinese text to/from GB or Big5 systems?
  29.  (8) What else do I need to know about alt.chinese.text?
  30.  (9) Why isn't it a good idea to cross-post articles to alt.chinese.text?
  31. (10) How many people read alt.chinese.text?
  32. (11) What is alt.chinese.text.big5?
  33. (12) My site does not carry alt.chinese.text. What can I do about that? 
  34. (13) What other net resources broadcast directly readable Chinese text?
  35. (14) Where may I obtain the latest version of this FAQ?
  36.  
  37.     *           *             *             *             *
  38.  
  39.  
  40.  (1) What are those ~{BRF_0KTc5D6+Nw~}'s posted to alt.chinese.text? 
  41.  
  42.      Believe it or not, they are supposed to be Chinese characters. 
  43.      They are usually coded in the "HZ" protocol. You'd need the
  44.      software that understands the protocol to read them.
  45.  
  46.      If you have the right software installed on your system, you
  47.      may be able to read the Chinese text on this newsgroup directly
  48.      just as you would with English newsgroups.
  49.  
  50.  
  51.  (2) Where can I find the software to read Chinese articles?
  52.  
  53.      It depends on what kind of machine you are using. The following is
  54.      probably an incomplete list of software which you can use to read
  55.      this newsgroup:
  56.  
  57.      [If you have problems using the programs listed below, you could
  58.      seek assistance from (1) local users; (2) fellow alt.chinese.text 
  59.      netters; (3) software authors. The FAQ maintainer most probably 
  60.      can't help you.]
  61.  
  62.      [New ftp site: apparently the entire ifcss.org ftp directory is
  63.      being mirrored in nctuccca.edu.tw:Chinese/ifcss.org/ (IP address
  64.      140.111.3.21). If ifcss.org is down, you may want to try there.] 
  65.  
  66.   a. If you are using a PC/Compatible running MS-DOS:
  67.      (1) ZWDOS -- is a MS-DOS kernel extension that gives DOS text mode
  68.      programs the ability to enter, display, manipulate and print 'zW' 
  69.      and HZ Chinese text. Small memory requirement. Supports EGA, VGA
  70.      or Hercules Monographic displays. Available for anonymous ftp at:
  71.                ifcss.org:software/dos/ZWDOS/*.*
  72.                cs.purdue.edu:pub/ygz/zW-hz/zwdos*.zip
  73.      [Author: Ya-Gui Wei <yawei@bronze.ucs.indiana.edu>]
  74.  
  75.      (2) NJStar -- A Chinese word processing program supporting GB,
  76.      HZ and zW codes. Requires Hercules, EGA, VGA or better video 
  77.      hardware. A trial version of the program can be ftp'ed from:
  78.                ifcss.org:software/dos/editor/njs210-*.zip
  79.      [Author: Hong-bo Ni.]
  80.  
  81.      (3) KORE -- Fast Chinese/Japanese text viewing program for MS-DOS.
  82.      Supports GB and HZ. Chinese fonts are now provided.
  83.      Available at:
  84.                mindseye.berkeley.edu:pub/kanji/kanji-viewer/*.*
  85.      [Author: Frank Klemm <pfk@rz.uni-jena.de>]
  86.  
  87.   b. If you are using an Apple Macintosh, try:
  88.      (1) Subtitle -- a program which decodes zW and HZ texts as subtitles
  89.      for some terminal emulators. Runs with or without Chinese OS. A trial 
  90.      version can be ftp'ed from:
  91.                ftp.apple.com:pub/lai
  92.                ifcss.org:software/mac/viewer/subtitle2.hqx
  93.      [Author: Ed Lai <lai@apple.com>]
  94.  
  95.      (2) MacViewHZ -- A Chinese text viewer which doesn't require 
  96.      Chinese OS. Supports HZ, GB, Big5. Available for ftp at:
  97.                ifcss.org:software/mac/viewer/macviewhz.hqx
  98.  
  99.      (3) NewsWatcher -- Macintosh users who have Chinese system software, 
  100.      MacTCP, and access to an NNTP news server can use a version of 
  101.      NewsWatcher specially designed to handle HZ encoding. Available at:
  102.                ifcss.org:software/mac/viewer/NewsWatcher.new.hqx
  103.      [Author: John H. Jenkins <John_Jenkins@taligent.com>]
  104.  
  105.      (4) HZTerm -- a simple terminal emulator that supports GB, HZ
  106.      and zW codings. Requires Mac Chinese OS version 6.0 or later. 
  107.      Available at:
  108.                ifcss.org:software/mac/viewer/hanziterm-0.5.hqx
  109.      [Author: Ricky Yeung <ryeung@eng.sun.com>]
  110.  
  111.      (5) If you have a Tektronix compatible terminal emulator (such as
  112.      VersaTerm), you may be able to use Chirk.  See c. (3).
  113.  
  114.   c. If you are using a Unix system/workstation:
  115.      (1) CXTERM -- is an xterm with Chinese extension. It understands
  116.      Chinese text coded with the Guo-Biao format. To read HZ and 'zW'
  117.      codes, you also need 'HZTTY'. Requires X-Windows. Available:
  118.                ifcss.org:software/unix/X-Window/cxterm*.Z
  119.                ifcss.org:software/unix/X-Window/hztty*.Z
  120.            cs.purdue.edu:pub/ygz/cxterm*.Z
  121.            cs.purdue.edu:pub/ygz/zW-hz/hztty*.Z
  122.      [Author: Zhang Yongguang ygz@cs.purdue.edu]
  123.  
  124.      (2) MULE -- Mule is a MULtilingual Enhancement to GNU Emacs which
  125.      can handle Japanese, Chinese or Korean (16 bits) characters.
  126.      For Chinese there is support for both GB and Big5. Subscribers of
  127.      alt.chinese.text will find it useful to use GNUS with hz2gb.el,
  128.      which does HZ/zW encode/decoding automatically. Runs as stand-alone
  129.      X client or with CXTERM. Available at:
  130.                sh.wide.ad.jp [133.4.11.11]:/JAPAN/mule/*
  131.      [Author: Ken'ichi Handa handa@etl.go.jp]
  132.  
  133.      Alternative pinyin input methods (including phrase input) for MULE
  134.      available at:
  135.                linac.fnal.gov:pub/pig.tar.Z
  136.      [Author: Ping Zhou, zhou@okra.fnal.gov]
  137.  
  138.      (3) Chirk -- A Unix program for viewing Chinese text on Tektronix
  139.      compatible graphic terminals (Graphon 225, 230, 140; DEC VT240, 
  140.      VT330/340; etc.) and terminal emulators (XTerm on X-Windows, 
  141.      VersaTerm on Macintosh, etc.)  C source code is provided and may 
  142.      be portable to other platforms. Supports Guo-Biao, Big5, zW and HZ.  
  143.      [To use Chirk with rn, try "s | chirk".] 
  144.      Available for ftp at:
  145.                crl.nmsu.edu:pub/chinese/ChiRK*.tar.Z
  146.                ifcss.org:software/unix/viewer/ChiRk*.Z
  147.      [Author: Bo Yang eric@sdphu1.ucsd.edu]
  148.  
  149.   d. If you have access to a PostScript Printer:
  150.      (1) CNPRINT. Prints HZ or GB text on Unix or VMS. Ftp site:
  151.                ifcss.org:software/unix/print/cnprint*.Z
  152.      [Author: Cai Yidao <cai@neurophys.wisc.edu>]
  153.  
  154.      (2) GB2PS. Converts GuoBiao or HZ Chinese text into hard copies
  155.      by using PostScript printers. Runs on Unix. Ftp site:
  156.                ifcss.org:software/unix/print/gb2ps*.Z
  157.                bellatrix.anu.edu.au:pub/gb2ps/gb2ps.2.02.tar.Z.
  158.      [Author: William Sun william@cs.anu.edu.au]
  159.  
  160.   e. If you only have access to a dumb terminal. Reading Chinese on a
  161.      dumb terminal is not going to be comfortable, but it can be done.
  162.      You may use 'hzview', but will need hz2gb from the HZ package
  163.      described in question 5 (despite the name, hzview does not support
  164.      HZ coding directly.)  Ftp'able from:
  165.                ifcss.org:software/unix/viewer/hzview.2-0.tar.Z
  166.      [Author: Fung Fung Lee lee@rinconada.stanford.edu]
  167.  
  168.      Hzview is also useful for making large Chinese character banners.
  169.  
  170.  
  171.      The above list is not intended to be an exhaustive list of Chinese 
  172.      software.  It is intended to help the beginning netter getting
  173.      started reading this newsgroup. Wherever possible, only software 
  174.      packages that directly support the 'zW' or 'HZ' protocols and are 
  175.      readily available through internet FTP as public domain, freeware,
  176.      or shareware, are listed. [The only commercial software known to 
  177.      support 'zW' and 'HZ' is NJStar.]  Additional criteria of quality, 
  178.      ease of use, universality of application may be considered. If 
  179.      you know of any software that I should have included, please drop 
  180.      me a note.
  181.  
  182.      For a more comprehensive listing of Chinese software, see 
  183.                ifcss.org:/software/Catalog 
  184.      [By Xiaofei Wang and Liedong Zheng <ftp-admin@ifcss.org>]
  185.  
  186.  
  187.  (3) Are these software packages pretty easy to use?
  188.  
  189.      Supposedly. Some of the software packages listed above are either 
  190.      terminal emulators or can be run in conjunction with a terminal
  191.      emulator.  Once you install them, reading Chinese text on this 
  192.      newsgroup should be easy.  For example, if you are using ZWDOS
  193.      or cxterm with hztty, the Chinese texts posted on this newsgroup
  194.      will show up on your screen as Chinese characters automatically
  195.      without any efforts on your part.  Other programs (text viewers)
  196.      require that you run the program with the Chinese text file as
  197.      input every time.
  198.  
  199.      Consult the documentation with the software for their exact
  200.      specifications.
  201.  
  202.      If you have problem installing the software, you may post help 
  203.      requests to alt.chinese.text or contact the software authors.
  204.  
  205.  
  206.  (4) How do I post Chinese text articles to usenet?
  207.  
  208.      If you are using a software package listed above which supports
  209.      Chinese character input, (such as ZWDOS, cxterm, or Mule), you 
  210.      can already do this, and it is probably very similar to posting 
  211.      English articles. Consult the documentation for the software 
  212.      package for information about how to input Chinese characters 
  213.      with the package.
  214.  
  215.      If you do not have a software package into which you can directly
  216.      type in Chinese characters, but you do have access to software
  217.      that produce GB or Big5 coded Chinese text, you may use the
  218.      conversion programs mentioned in question (7) to convert them
  219.      to HZ or zW and then post them to usenet.
  220.  
  221.  
  222.  (5) What is 'HZ'?
  223.  
  224.      'HZ', and the very similar 'zW', are Chinese coding protocols 
  225.      derived from Guo-Biao, the standard Character set for 
  226.      information interchange used in mainland China. Compared
  227.      to Big-5 (character set used in Taiwan), Guo-Biao has
  228.      the property that each character in the set can be easily
  229.      represented by 2 printable (7-bit) ASCII characters. The 'zW' 
  230.      and HZ are protocols that allow mixing of these Chinese 
  231.      text and ASCII (English) text, which are the main reason 
  232.      they are being used in this newsgroup.  
  233.  
  234.      A description of the HZ protocol is available for ftp at:
  235.                ifcss.org:software/unix/convert/HZ-2.0.tar.Z
  236.      [Author: Fung Fung Lee lee@rinconada.stanford.edu]
  237.  
  238.  
  239.  (6) What is FTP and how do I use it?
  240.  
  241.      FTP stands for the internet File Transfer Protocol. There are
  242.      many internet sites with FTP accounts where a remote user can
  243.      connect to and download materials of various kind.
  244.  
  245.      It is beyond the scope of this document to provide a detailed
  246.      tutorial about network file transfers. Yet I hope the following
  247.      example will give you an idea.
  248.  
  249.      At your system prompt, type:
  250.        ftp ifcss.org                 [connect to remote host]
  251.        username: ftp                 [or "anonymous"]
  252.        password: your_name           [or anything else]
  253.        binary                        [use binary transfer]
  254.        cd software/unix/convert      [change directory]
  255.        get HZ-2.0.tar.Z              [get file]
  256.        bye
  257.  
  258.      After getting the files, you'd probably need to uncompressed/
  259.      unarchived the files in some system specific manner. Your local
  260.      system admin or users of similar machines should be your best
  261.      source of help for this. The following is only a brief summary:
  262.  
  263.      (A). Unix compressed files often have a .Z extension. To uncompress,
  264.      use the Unix command "compress -d filename". After that you may
  265.      get a file with a .tar extension. You can untar a file by 
  266.      "tar -xvf filename".
  267.  
  268.      (B). DOS (PC) compressed files often have a .zip extension.
  269.      To uncompressed, use "pkunzip filename". (Get pkunzip.exe from
  270.      ifcss.org:software/dos/utils.)
  271.  
  272.      (C). MacIntosh files often have the .hqx extension. To uncompress,
  273.      you'd need "binhex" and "stuffit", both available from
  274.      ifcss.org:software/mac/utils.
  275.  
  276.      The CND Chinese Magazine (Hua Xia Wen Zhai) has compiled a suite
  277.      of help files some of which may be useful for you. To obtain
  278.      an index, send a mail "get cmhelp index" to listserv@uga.bitnet.
  279.  
  280.  
  281.  (7) How do I convert zW/HZ Chinese text to/from GB or Big5 systems?
  282.  
  283.      If you are using a Guo-Biao based system, conversion programs 
  284.      can be found in the HZ-2.0.tar.Z package mentioned in question 
  285.      (5). Use hz2gb and gb2hz to convert between Guo-Biao and HZ 
  286.      text. If you are using a Big-5 based system, check out 
  287.      hc.tar.Z in ifcss.org:software/unix/convert, which lets you 
  288.      convert from Big5 to GB which can then be converted to HZ (and 
  289.      back). 
  290.  
  291.      The DOS executables of the zW<->HZ<->GB converter are at 
  292.      ifcss.org:software/pc/convert. The Macintosh version of 
  293.      hc (Big5<->GB) is in ifcss.org:software/mac/convert.
  294.  
  295.  
  296.  (8) What else do I need to know about alt.chinese.text?
  297.  
  298.      Alt.chinese.text is a free forum. It is not a topic oriented
  299.      newsgroup, as long as your articles are in Chinese or is
  300.      otherwise related to the subject "Chinese text." Nonetheless,
  301.      after you get a hang of the software, you are strongly
  302.      suggested to post in Chinese. Even for articles that best
  303.      serve their purposes in English, a Chinese summary should
  304.      still be provided.
  305.  
  306.  
  307.  (9) Why isn't it a good idea to cross-post articles to alt.chinese.text?
  308.  
  309.      Some netter cross-post articles to both alt.chinese.text and
  310.      alt.chinese.text.big5 [also see question (11)]. This is not a
  311.      good idea because the character coding systems on the two groups
  312.      are different. There is also a gateway which translates and
  313.      reposts between the two groups. If you post the same article
  314.      to both groups, each group will see TWO copies of your article.
  315.  
  316.      Cross-posting of articles to alt.chinese.text.* and English newsgroups
  317.      is also undesirable. Such articles frequently generate tons of
  318.      follow-ups in English from readers of the English groups. English-
  319.      only articles are generally not appreciated on a.c.t. and are
  320.      done only as a neccessary evil (such as this posting.)
  321.  
  322.  
  323. (10) How many people read alt.chinese.text?
  324.  
  325.      Ever since the newsgroup came into existance in July 1992
  326.      (with the help of Mr. Stephan Mosier of Indiana Univ
  327.      Computing Services. Thanks, Steve!), its readership has been
  328.      increasing steadily. The latest figures, compiled by DEC's
  329.      Network Systems Laboratory for May 1993, indicated 
  330.      that alt.chinese.text is read by 28000 users worldwide.
  331.  
  332.              Jul 1992            0
  333.              Nov 1992       11,000
  334.              Feb 1993       19,000
  335.              Mar 1993       28,000
  336.  
  337.     [Data since Nov 1992 curtesy of Brian Reid of DEC Network 
  338.      Systems Laboratory.]
  339.  
  340.  
  341. (11) What is alt.chinese.text.big5?
  342.  
  343.      Alt.chinese.text.big5 is a mirror of alt.chinese.text in Big5 
  344.      code, the industrial standard character set in Taiwan. Its 
  345.      contents are identical to alt.chinese.text, except that the
  346.      Chinese texts are represented using the Big5 character set.
  347.      The mirroring program is based at news.csie.nctu.edu.tw.
  348.  
  349.      To read alt.chinese.text.big5, you need a Chinese system that
  350.      supports the Big5 character set. Some of the programs listed
  351.      in this FAQ also supports Big5 (such as cxterm).  PC users in
  352.      Taiwan can read it by ftp'ing a free copy of the KC Chinese
  353.      system from moers2.ecu.edu.tw:chinese-pub/chinese-sys/kc/kc.zip.
  354.  
  355.      Keep in mind that Big5 is an 8-bit coding standard. Therefore
  356.      your terminal and its connections to all the hosts/gateways 
  357.      must be set up to accommodate 8-bit data. Consult your local
  358.      system people for details about this. If it is too much trouble,
  359.      you may want to just read alt.chinese.text.
  360.  
  361.  
  362. (12) My site does not carry alt.chinese.text. What can I do about that? 
  363.  
  364.      The first thing to do is to tell your news administrator about
  365.      alt.chinese.text and ask him/her to carry it. Some sites do
  366.      selectively carry alt groups so it may be simply a matter of
  367.      asking. 
  368.  
  369.      Many gopher sites also offer access to usenet newsgroups. If
  370.      you have access to gopher, you should be able to find a gopher
  371.      server which carries usenet newsgroups and with alt.chinese.text
  372.      among them. 
  373.  
  374.      The long term cure, of course, is to upgrade our newsgroup into
  375.      one of the "official" usenet hierarchies (rec, soc, comp, 
  376.      etc -- I am not sure exactly which hierarchy our group belongs
  377.      to.  Perhaps we should have our own cn.* hierarchy?), provided 
  378.      someone is willing to spending time leading us through the voting 
  379.      process. 
  380.  
  381.  
  382. (13) What other net resources broadcast directly readable Chinese text?
  383.  
  384.      The following net-resources broadcast Chinese materials coded
  385.      in the HZ format which are directly readable with the software
  386.      described in this FAQ:
  387.  
  388.   a. The CND Chinese Magazine, Hua Xia Wen Zhai, broadcasts an HZ 
  389.      edition through a list at CMUWA-L@UWAVM. To subscribe, send a 
  390.      message to
  391.               LISTSERV@UWAVM.BITNET            (Bitnet)
  392.          or   LISTSERV@UWAVM.U.WASHINGTON.EDU  (Internet)
  393.      With the body of the message containing only:
  394.               SUB CMUWA-L Lastname Firstname
  395.      The magazine will be delivered to your e-mail box every Friday.
  396.  
  397.   b. The Chinese Poem Discussion list broadcasts Chinese poems in
  398.      HZ and other formats. To subscribe, send a message to
  399.               LISTSERV@UBVM.BITNET             (Bitnet)
  400.          or   LISTSERV@UBVM.CC.BUFFALO.EDU     (Internet)
  401.      With the body of the message containing only:
  402.               SUB CHPOEM-L Lastname Firstname
  403.  
  404.   c. News about Taiwan available through gopher at the National Sun 
  405.      Yat-Sen University. To access, (1) enter HZ environment, (2)
  406.      use "gopher gopher.csie.nctu.edu.tw 70", (3) choose ~{VPI=4sQ'~}
  407.      ~{J11(PBNE!!D?B<#,~} (4) choose csie server, (5) choose "HZ info-
  408.      times."
  409.  
  410.   d. Anonymous ftp site ifcss.org also contains numerous HZ-coded
  411.      Chinese material. Subdirectories under china-studies/hz contain
  412.      some material previously posted to alt.chinese.text. Other
  413.      subdirectories in "china-studies" contain Chinese text coded
  414.      in GB or Big-5.
  415.  
  416. (14) Where may I obtain the latest version of this FAQ?
  417.  
  418.      This FAQ is posted monthly to alt.chinese.text and news.answers. 
  419.      The latest version of this FAQ is also available from the following
  420.      anonymous FTP sites:
  421.  
  422.      pit-manager.mit.edu:pub/usenet/news.answers/chinese-text-faq.Z
  423.      ftp.uu.net:usenet/alt.chinese.text/H_t_R_C_T_o_U:_F_f_a.c.t.Z
  424.  
  425.  
  426.  Compiled by Ya-Gui Wei ~{N:QG9p~}.
  427.  
  428.  Acknowledgements:
  429.      Thanks are due to Dan Jacobson ~{;}5$Da~}, Fung Fung Lee ~{@n7c7e~}, 
  430.      and Ricky Yeung for valuable advice for the improvement of this 
  431.      document.
  432.